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Em imagens como as ohtidas aom satelites^ existe uma al 
ta Qorvelagdo entre pontos proximos da imagem, Alem die to ^ em imagens 
mul tie spec trais os valores de seus pontos tendem a ocupar regioes den 
sas e restritas do espago de oaraoteristioas . Os algoritmos usuais de 
classificagao mo-supervisionada (agregagdo) utilizams em geralt so o 
segundo tipo de vedundancia (espeatral) , mas ndo o primeiro Jr edundan 
aia espacial) . Neste trabalho apresenta-se urn metodo de pri'-classifi 
cagdo e oompactagdo, que divide a imagem em janelas iguais^ onde ~e 
feita a agregagdo. As classes obtidas sdo usadas numa nova agregagdo , 
reunindo vdrias janelas vizinhas e, assim, sucessivamente, ate que se 
tenha uma unica regido correspondente a imagem toda. Deste modo, usam- 
-se, ao mesmo tempo ^ os dois tipos de informagdo (espectral e espa 
ciaDt e se reduz o esforgo computacional, por se considerar em cada 
agregagdo apenas urn pequeno numero de pontos, 0 metodo e ilustrado com 
aplicagoes em imagens obtidas pelo satelite LANDSAT. 
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ABSTRACT 


In images as those obtained by satellites, there is a 
high correlation between neighbor image points. Besides that, in 
multispectral images the values of the points tend to occupy dense and 
restricted regions of the feature space. Usually, algorithms for 
nonsupervised classification (clustering) utilize, in general, just the 
second type of redundancy (spectral) but not the first (spatial 
redundancy). In this work a method for compacting and pre-classifying 
images is presented, which divides the image into windows of the same 
size, where the clustering is made. The classes that are obtained in 
several neighbor windows are clustered and then, successively , until 
only one region, corresponding to the whole image, is obtained. In 
this way, the l^o types of information (spatial and spectral) are 
used, and also the computational effort is reduced as in each 
clustering only a few number os points is considered. The method is 
illustrated with applications to images obtained by the LAWS AT 
satellite. 


K INTRODUCAO 


Em imagens naturals multiespectrais e, em particular, em 
imagens obtidas de satelltes, existem, alem da redundancia espectral, 
dois outros tipos de redundancia; pontos vizinhos da imagem sao correU 
cionados, e valores dos pontos da imagem nos diversos canais nao ocupam 
todos os valores possTveis do espago de caracterTsticas mas, ao contrS 
rio, tendem a se concentrar em regioes restritas e compactas. 

Todos estes tipos de redundancia tern sido observados por 
pesquisadores que os usam para repret^en ar as imagens de uma forma mais 
compacta e, assim, economizar em ani.utenagem e transmissao, oumesmore^ 
sal tar caracterTsticas das imagens que de outra forma permaneceriam ob£ 
curecidas. 


Urn mitodo de representagao de imagens tem sua efetivida 
de, medida nao s5 pela compactagao conseguida, mas tambem pela fidelid^ 
de da representagao. Esta ultima depende do proposito da represent^ 
gao - para processamento humano ou por maquina. Uma medida nao-subjetj_ 
va da fidelidade i o erro midio quadratico entre a imagem original e a 
imagem recons truTda a parti r da representagao. Este critirio tem a seu 
favor 0 fato de ser simples e matematicamente tratavel, embora nem sem 
pre a imagem mais fiel - segundo padroes subjetivos - seja a de menor 
erro midio quadratico. 

A tecnica das componentes principais, obtidas a partir da 
transformagao de Karhunen-Loive , tem sido usada para produzir imagens 
realgadas aproveitando-se a redundancia espectral das imagens (Camara 
et alii, 1980). Mostra-se que a transformagao de Karhunen-Loeve e a que 
da 0 menor erro medio quadratico entre as transformagoes ortonormais. 

A transformagao de Karhunen-Loeve pode ser usada tambem 
para explorar a redundancia espacial. Basta que se considere uma imagem 

I 

nxm como urn vetor de nm componentes (Duda e Hart, 1973). A desvanta 
gem e que se obtem, em geral, urn numero excessive de componentes para 
urn processamento eficiente. 


- 2 - 




Encontram-se na literatura algumas tentativas de incorpo 

rar a informagao espacial em classificadores de imagens {Landgrebe, 
• ^ 

1978; Dutra, 1981). Tambem em certos codigos para compactagao, tais co 
mo 0 "run lenght encoding" ou o DPCM ("differential pulse code 
modulation"), a codificagao baseia-se na correlagao existente entre pon 
tos vizinhos da imagem. 

Uma imagem multi espectral obtida pelo satelite LANDSAT 
tern quatro dimensoes (canais). Em cada dimensao urn dado ponto pode assu 
mir 256 valores (0 a 255). Neste caso, tim-se (256)** = 2^2 valores dife 
rentes que podem ser assumidos por pontos da imagem. Tipicamente, uma 
imagem LANDSAT com cerca de 6x10^ pontos ("pixels") ocupa menos que 
10** valores distintos do espago de caracterTsticas (Shlien, 1975). Me£ 
mo estes 10** pontos estao densamente agrupados em regioes restritas do 
espago. Isto indica que se pode representar uma imagem LANDSAT por urn 
numero pequeno de vetores do espago de caracterTsticas, incorrendo-se 
num pequeno erro medio quadratico. Alguns pesquisadores, notadamente 
Lowitz (1978), procuram usar esta forma de compactagao para diminuir as 
taxas de transmissao (bits/segundo) necessarias para o envio, em tempo 
real, de imagens de satelites para as estagoes terrenas. De fato, se a 
imagem for dividida em blocos ("janelas") de igual tamanho (por exem 
plo, 16x16) e se os pontos deste bloco foram rotulados em 8 classes, po 
de-se enviar, em vez dos valores de cada ponto, s classe a que o ponto 
pertence. Para recons trugao da imagem, e necessario enviar, apos cada 
bloco, vetores representatives para cada uma das oito classes. Numa ima 
gem com quatro canais, obtem-se uma taxa de compressao superior a 9 e, 
segundo Lowitz (1978), com urn erro de reconstrugao abaixo de 1% (erro 
medio quadratico). 

E obvio que, no esquema descrito acima, a classificagao 
das janelas devera ser nao-supervisionada, ou seja, uma aglomeragao 
("clustering") dos pontos. Alim disto, ela tera de ser feita em peque 
nas janelas, nao somente devido ao custo computacional de classificagao 
da' imagem inteira, como tambem porque necessitar-se-ia de urn ‘ numero 
maior de classes para representar areas maiores da imagem. Isto faria 
com que a taxa de compressao caTsse. 



Neste trabalho propoe-se urn metodo para classificar, sem 
supervlsao, imagens LANDSAT em um numero relatlvamente pequeno de c1a£ 
ses, no qua! procura-se levar em conta a informagao espaclal das Ima 
gens. A Imagem classificada e, portanto, compactada pode servir tanto 
para ser armazenada (ou transmitlda) , como para ser usada para fins de 
classificagao supervisionada. Previ-se que, neste ultimo caso, as tare 
fas - tanto do operador quanto do classificador - estejam grandemente 
faciUtadas, uma vez que a imagem estara pre-classificada. 

2. descricao do METODO 

0 metodo (ou algoritmo) que se propoe procura representar 
imagens LANDSAT atraves de um numero pequeno de vetores, associados as 
classes nas quais a imagem e dividida. Di fere do metodo de Lowitz (1978) 
pelo fato de estes vetores representarem toda a imagem, e nao uma jane 
la da mesma. 

Ao inves de classificar diretamente toda a imagem, o que 
e inviavel, procura-se classificar a imagem em varios niveis. IniciaJ^ 
mente a imagem e dividida em janelas de mesmo tamanho, (tal como em 
Lowitz, 1978) que sao classificadas sem sup^rvisao. Num segundo nTvel , 
varias janelas vizinhas sao reunidas e e feita a classificagao, utili^ 
zando-se os resultados provenientes da classificagao do primeiro nTvel, 
Este processo - no qual se aglomeram varias classes de um nTvel, refe 
rentes a janelas contTguas, obtendo-se classes de um nTvel mais alto e 
uma unica janela - e repetido ate se obter uma janela que corresponde a 
imagem inteira. Por exemplo, numa imagem 512x512 podem-se usar tres nT 
veis do seguinte modo: 

nTvel 1 : janelas quadradas 16x16, cujos pontos sao classificados 
em 8 classes; 

nTvel 2 ; janelas retangulares contendo 4x8 janelas do nTvel 1, 

' cujas classes sao aglomeradas em 16 novas classes; 



nTvel 3 ; janela que corresponde a toda Imagem (8x4 janelas do nT 

vel 2), onde a aglomeragao e feita sobre 512pontos (clas 
• •• 

ses obtidas no nTvel 2)i resultando em novas 32 classes. 

0 numero de classes resultantes em cada aglomeragao varla 
de nTvel para nTvel, sendo menor nos nTveis inferiores e maior nos supe 
riores, uma vez que nestes nTveis as Janelas abrangem regioes mai^res. 

Nada impede que se use, nos varios nTveis, o mesmo algo 
ritmo de aglomeracao. No caso da imagem 512x512 dividida em tres nT 
veis, 0 algoritmo seria usado 1057 (1024 + 32+ 1) vezes. 

0 fato de usar varios nTveis reduz o custo computacional 
quando comparado com o procedimento direto, que seria aglomerar num uni^ 
CO nTvel toda a imagem. Nao e este, contudo, o unico merito de fazer a 
aglomeragao, hierarquicamente, em varios nTveis. Uma vez que dois poji 
tos distintos de uma mesma janela e, portanto, proximos, sao classifica 
dos numa unica classe, nos nTveis seguintes esses pontos continuarao 
pertencentes a mesma classe. Em outras palavras, dois pontos tenderao a 
pertencer a mesma classe se estiverem espectral ou espacialmente proxi_ 
mos. 


Para ter uma ideia do custo computacional do metodo, e ne 
cessario definir qual o algoritmo de aglomeragao usado. Urn dos mais sim 
pies e 0 algoritmo das "k medias" (Mac Queen, 1967) o qual, dados n pon 
tos, os divide em k classes. Pode-se mostrar que o algoritmo das k mi 
dias converge para urn mTnimo local do erro medio quadratico. Consideran 
do-se que o numero de classes resultantes da aglomeragao dobra a cada 
nTvel, a relagao entre os tempos de execugao da classificagao de toda 
imagem e o da classificagao hierarquica i da ordem de 2^’^, onde n e o 
numero de nTveis usados. Em ambos os casos, o tempo de execugao cresce 
linearmente com o numero de pontos da imagem. Vale notar tambem que a 
classificagao da imagem inteira incorre num custo computacional extra, 
devido a necessidade de percorrer varias vezes a imagem inteira (tantas 
vezes quanto o numero de interagoes necessaries no algoritmo das k 
dias). 
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3. DESCRICAO DOS EXPERIMENTOS 


(X (netodo descrito na segao Z foi testado numa Imagem 
LANDSAT 512x512, a qual contem a BaTa da Guanabara e arredores. A Ima 
gem utilizada se caracteriza por uma grande variedade de texturas e de 
— nTveis de cinza. A imagem foi dividida em tres niveis, conforme exemplo 
da segao anterior. 0 algoritmo usado na aglomeragao foi o das k medias. 

Para calcular o erro medio quadratico da represen tagao, a 
imagem foi reconstruTda, co1ocando*se em cada ponto a media da classe a 
que 0 ponto pertence. Uma comparagao visual entre a imagem original e a 
reconstituTda mostra pequenas diferengas: a imagem reconstituTda e mais 
homogenea, e num e noutro ponto pode-se notar urn "efeito de borda" nos 
limites das janelas do 19 nivel. 

Foram feitos varios experimentos com a finalidade de verj[ 
ficar a influencia do numero de classes do primeiro nTvel, bem como a 
do numero de iteragoes do algoritmo de aglomeragao no erro medio quadra 
tico relativo (razao entre o erro medio quadratico e a variancia da im^ 
gem). Os resultados dos experimentos estao sumariados na Tabela 1, onde 
se fiz variar tanto o numero de classes do 19 nTvel quanto o numero de 
Iteragoes, mantendo constante o numero de classes do segundo nTvel (16). 
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TABELA 1 

ERRO MEDIO QUADRATICO RELATIVO E PERCENTUAL 
PARA OS NTVFIS 1 E 2, ONDE SE VARIA 0 NOMERO DE CLASSES 
E DE ITERACOES NO NTVEL 1 




IB 

NOMERO DE CLASSES DO NTVEL 

1 



li 



12 






8 

10 

14 


16 


1 

n 

3,5 

2,5 

2,1 

1.8 


1.6 

NOMERO 

DE 

H 

4,8 

3,9 

3,6 

3.3 


3.2 


0 

n 

n 

mi 

1.7 

1.4 


1.3 

c 

H 

HI 

HI 

3,2 

3.0 


2.0 

ITERACOES 

o 

1 

2,5 

1.9 

1.5 

1.3 


1.1 




2 

4,0 

3,3 

3,1 

2.8 


2.8 


Com 8, 16 e 32 classes no 19, 29 e 39 niveis, e com 2, 4 
e 8 aglomera^oes nos 19, 29 e 39 nTveis, respectivamente, obteve-se urn 
erro medio quadratico relativo a imagem Intel ra de 6,9%. 

Quanto a taxa de compressao, esta fol ligeiramente supe 
rior a 6 para a imagem considerada. 

4. CONCLUSOES 


Neste trabalho apresentou-se urn metodo para classificagao 
nao-supervisionada de imagens multiespectrais. 0 metodo foi ilustrado 
atraves de sua aplicagao a uma imagem LANDSAT 512x512. 

Embora a aparencia visual da imagem reconstruTda seja pro 
xima da original, o erro percentual obtido (6,9%) e bastante superior 
ao'relatado em outros trabalhos, que e da ordem de 1% (Lowitz, '978). E 
verdade que nestes trabalhos so se usou urn unico nTvel de aglomeragao e 
que, neste caso, como pode ser visto na Tabela 1, os erros sao compari 
veis. 
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Quanto a implementa^ao, o mitodo proposto se presta a uma 
execugao* paralel 4, uma vez que aglomera^Ses de um mesmo nTvel sao inde 
pendentes. Uma Implementagao em "hardware" tair^em serla faciUtada, ca 
so se explore 0 paralellsmo, pelo fato de haver poss 1 b 1 l 1 dade de usar 0 
mesmo algorltmo em todas as aglomeragoes e em todos os nTveis. A arqui* 
tetura mals adequada serla a de um "array" de processadores, todos exe 
cutando 0 mesmo algoritmo. 

Embora seja utilizavel para compactagao, 0 algoritmo pre£ 
ta>se mais para um primeiro passo de um sistema de classificagaode gran 
des areas. Podem-se Imaginar algoritmos de classificagao supervisionada 
extremamente rapidos* que trabalhariam na imar^em compactada. Pode>se con 
Jecturar, tambem, que a precisao de classificagao deste si sterna ser la 
maior que a precisao de classificadores ponto a ponto, uma vez que a In 
formagao espacial foi considerada no passo de pre-classificagao. 
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